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Beschreibung 

Verfahren zur sprecherabhangigen Spracherkennung und 
Spracherkennungs system 

5 

Die Erfindung bezieht sich auf ein Verfahren zur 
sprecherabhangigen Spracherkennung mit einem 
Spracherkennungssystem, bei dem SprachauBerungen eines 
10 Benutzers trainiert werden und den trainierten 

SprachauBerungen Befehle zugeordnet werden, sowie auf ein 
Spracherkennungssystem zur Durchftihrung des Verfahrens. 

Ein solches Verfahren ist nach dem Stand der Technik 

15 aufgeteilt in einen Spracherkennungsmodus und einen 
Trainingsmodus • Bei dem Spracherkennungsmodus werden 
SprachauBeriingen des Benutzers erfasst, woraufhin in einer 
Datenbank ein der SprachauBerung zugeordneter Bef ehl 
aufgefunden wird, sofern die SprachauBerung eine ausreichende 

20 Obereinstimmung mit einer SprachauBerung zeigt, die zu dem 

Befehl gehort und zu einem fruheren Zeitpunkt aufgenommen und 
gespeichert wurde. Ira Spracherkennungsmodus ist eine neue 
Zuordnung zwischen einer neuen SprachauBerung und einem 
neuen Befehl nicht moglich. Diese Vorgange finden vielmehr in 

25 dem Trainingsmodus statt, bei dem der Benutzer 

SprachauBerungen von sich gibt und jeder einzelnen 
SprachauBerung nach ihrer Aufnahme einen Befehl zugeordnet. 
Die gewonnene Zuordnung wird in der Datenbank abgelegt. 
Zugeordnete Befehle kSnnen beispielsweise Anwahlvorgange far 

30 Teilnehmer eines Kommunikationsnetzwerkes Oder 
Sprachsteuerbefehle sein. 

Das Verfahren nach dem Stand der Technik hat den Nachteil, 
dass das Trainieren neuer Befehle insofern umstSndlich ist, 
35 dass jedes Mai von dem Spracherkennungsmodus zu dem 

Trainingsmodus von dem Bunutzer aktiv umgeschaltet werden 
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muss. Dies wirkt sich auch negativ auf die Akzeptanz von 
Spracherkennungssystemen im Markt aus. 



Ausgehend hiervon liegt der Erfindung die Aufgabe zugrunde, 
ein Verfahren zur sprecherabhangigen Spracherkennung sowie 
ein Spracherkennungssystem daftir anzugeben, bei dem ein 
Trainieren neuer Befehle zeitsparend durchfUhrbar ist. 

Diese Aufgabe wird hinsichtlich des Verfahrens der eingangs 
genannten Art dadurch gel6st, dass bei Nichterkennung einer 
SprachauBerung durch das Spracherkennungssystem dem Benutzer 
angeboten wird, die SprachSufierung vmmittelbar einem neuen 
Befehl zuzuordnen. 



Bei der DurchfOhrung des Verfahrens befindet sich ein 
Spracherkennungssystem immer im Spracherkennungsmodus, wobei 
jedoch die Option zur Verftlgung steht, bei Nichterkennung 
einer Sprachaufierung unmittelbar eine neue Befehlszuordnung 
vorzunehmen. Auf diese Weise ist das Trainieren neuer Befehle 
in die Spracherkennung selbst integriert und kann dann 
stattfinden, wenn eine Sprachaufierung nicht erkannt worden 
ist. Befindet sich beispielsweise der Benutzer gerade in der 
Situation, dass er einen neuen Befehl far ein 
Spracherkennungssystem trainieren will, reicht es aus, eine 
bisher nicht benutzte Sprachaufierung zu artikulieren, wonach 
das Spracherkennungssystem eine Nichterkennung der neuen 
Sprachaufierung feststellt und dann die Option anbietet, die 
neue Sprachaufierung einem neuen Befehl zuzuordnen. Nach 
Vornahme der Zuordnung kann der Befehl unmittelbar ausgefOhrt 
werden . 



Bei einer bevorzugten Aus fOhrungs form kann bei Nichterkennung 
der Sprachaufierung durch das Spracherkennungssystem der 
Benutzer optional entweder die Sprachaufierung wiederholen 
Oder die Sprachaufierung einem neuen Befehl zuordnen. Diese 
Aus ftihrungs form tragt der Tatsache Rechnung, dass eine 
Sprachaufierung gerade aufierhalb eines Ahnlichkeitsbereiches 
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zu einer SprachauBerung liegen kann, der bereits ein 
gewvinschter Befehl zugeordnet ist. In diesem Fall ist keine 
Zuordnung einer neuen SprachauBerung zu einem neuen Befehl 
beabsichtigt, Vielmehr muss diese SprachauBerung zur 
5 Verknapfung mit dem bereits trainierten Befehl wiederholt 
werden . 

Hinsichtlich eines Anfangszustandes eines 
Spracherkennungssystems ist bevorzugt fur das Verfahren 

10 vorgesehen, dass in dem Fall, wenn noch keiner SprachauBerung 
ein Befehl zugeordnet ist, das SpracherkennungssystCTi nach 
seiner Aktivierung sofort das Trainieren eines neuen Befehls 
anbietet. Dies passiert automatisch, wenn das 
Spracherkennungssystem die erste SprachauBerung naturgemaB 

15 nicht erkennt und die Option anbietet, einen neuen Befehl zu 
trainieren. 

Bei einer weiteren Ausftthrungsf orm kann vorgesehen sein, dass 
bei Nichterkennung einer SprachauBerung fur einen bereits 

20 trainierten Befehl durch das Spracherkennungssystem der 
Benutzer den Befehl auswahlen und diesen Befehl die 
SprachauBerung zuordnen kann. Dies betrifft den Fall, dass in 
einer Datenbank, welche die Zuordnungen zwischen 
SprachauBerungen und zugeh5rigen trainierten Befehlen 

25 enthalt, eine ,rschlechte''^ Version der SprachauBerung 

vorliegt, so dass eine Spracherkennung haufig f ehlschiagt . In 
diesem Fall ist es mSglich, dem bereits trainierten Befehl 
eine neue SprachauBeirung zuzuordnen. 

30 Bevorzugt wird fUr eine Erkennung einer SprachauBerung ein 
Sprachmuster erzeugt, das der SprachauBerung zugeordnet ist. 
Solche Sprachmuster, denen eine Extraktion wesentlicher 
Sprachmerkmale der SprachauBerung zugrvuide liegt, werden dann 
auch in der Datenbank verwendet, die in diesem Fall eine 

35 Zuordnung zwischen Sprachmustern und trainierten Befehlen 

enthait. Nach ihrer Aufnahme wird jede SprachauBerung in ein 
Sprachmuster umgesetzt, das dann weiter verarbeitet wird. 
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beispielsweise fQr die Entscheidung, ob es erkennbar ist oder 
nicht, d. h. bereits innerhalb eines Ahnlichkeitsbereiches 
eines Sprachmusters in der Datenbank vorliegt. 

In diesem Zusammenhang wird es als bevorzugt angesehen, vor 
einer Zuordnung eines Befehls zu einer SprachSuBerung zu 
prtifen, ob die SprachauBerung zuvor gespeicherten 
SprachauBerungen Shnlich ist. Auf diese Weise wird vermieden, 
dass bei einer Spracherkennung Verwechslungen unter 
verschiedenen Befehlen vorkommen, weil die jeweils 
zugehorigen SprachSuBerungen einander zu ahnlich sind. Dazu 
kann, beispielsweise lanter Verwendung der Extraktionsmerkmale 
far ein Sprachmuster, ein zulassiger Ahnlichkeitsbereich 
definiert werden. 



Die oben genannte Aufgabe wird hinsichtlich eines 
Spracherkennungs systems gel6st durch ein 

Spracherkennungs system far ein sprecherabhSngiges Erkennen 
von Sprache mit einer Sprachaufnahmeeinrichtung zur Aufnahme 
einer SprachauBerung eines Benutzers des 

Spracherkerinxingssystems, einer Suchmaschine, die zum Zugriff 
auf eine Datenbank ausgebildet ist, die eine Zuordnung 
zwischen SprachauBerungen und Befehlen enthait, vm einen der 
SprachauBerung zugeordneten Befehl aufzufinden, 
einer Umsetzeinrichtung zum Omsetzen des auf Grund der 
SprachauBerung aufgefundenen Befehls, wobei das 
Spracherkennungs system derart ausgebildet ist, dass bei 
Nichterkennung der SprachauBerung durch das 
Spracherkennungssystem dem Benutzer angeboten wird, die 
SprachauBerung unmittelbar einem neuen Befehl zuzuordnen. 

Ein solches Spracherkennungssystem erlaubt die Durchfahrung 
des oben beschriebenen Verfahrens und zeichnet sich gegenOber 
bekannten Spracherkennungssystemen dadurch aus, dass 
innerhalb eines Spracherkennungsmodus das Trainieren neuer 
Befehle ermSglicht wird. 
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Bevorzugt ist die Sprachaufnahmeeinrichtung mit einem 
Speicher verbunden, in dem die SpracMuBerung 
zwischengespeichert wird und der mit der Datenbank zum 
Einlesen der SprachSuBerung in die Datenbank verbunden ist. 
Dies ist bei bekannten Spracherkennungssystemen nicht der 
Fall, denn dort wird fxir einen Trainingsmodus unmittelbar auf 
die Datenbank zugegriffen, wahrend in einem 
Spracherkennungsmodus eine SprachauBerung ftir die Funktion 
der Suchmaschine zwar zwischengespeichert wird, der dann 
benutze Speicher aber nicht zum Einlesen einer SprachauBerung 
in die Datenbank ausgebildet/verknOpft ist. 

Vorzugsweise ist eine Merkmalsextraktionseinrichtung zvim 
Erzeugen eines Sprachmusters aus der SprachauBerung zwischen 
der Sprachaufnahmeeinrichtung und dem Speicher vorgesehen und 
das Sprachmuster ersetzt die SprachauBerung. 

Weitere Vorteile und Merkmale des Spracherkennungssystems 
sind bereits oben anhand der Beschreibung des Verfahrens zur 
sprecherabhangigen Spracherkennung eriautert worden. 

Ein Ausfuhrungsbeispiel der Erfindung wird nachfolgend anhand 
der Zeichnung noch naher eriautert. Die einzige Figur zeigt 
ein Ablaufdiagramm eines Verfahrens zur sprecherabhangigen 
Spracher kenn\ing - 

Ein Verfahren zur sprecherabhangigen Spracherkennung mittels 
eines Spracherkennungssystems wird nunmehr anhand der Figur 1 
eriautert. Nach einem Start des Spracherkennungssystems, das 
beispielsweise als Computersystem mit Anzeigeeinrichtung 
realisiert ist, wird einem Benutzer zunachst eine geeignete 
Benutzeroberfiache angezeigt, die auch eine Aktivierung ftir 
eine Aufnahme einer SprachauBerung beinhaltet („Push-to- 
Talk^^-Aktivierung) . in einem ersten Verfahrensschritt 1 wird 
eine SprachauBerung des Benutzers/Sprechers aufgenommen, und 
zwar mit Hilfe einer geeigneten Sprachaufnahmeeinrichtung. 
Mittels einer Merkmalsextraktionseinrichtung wird in einem 
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zweiten Schritt 2 ein Sprachmuster der SprachauBerung 
erzeugt, wobei ein Sprachmuster durch eine Koinbination 
extrahierter, charakteristischer Sprachmerkmale definiert 
1st. Das Sprachmuster wird in einem Speicher 
5 zwischengespeichert . 

In einem dritten Schritt 3 erfolgt mittels einer Suchmaschine 
die Abfrage, ob das erzeugte Sprachmuster in einer Datenbank 
enthalten ist, die Zuordnungen zwischen Sprachmustern und 

10 Befehlen enthalt. Diese Datenbank wird in einem 

Trainingsmodus des Spracherkennungssystems mit Inhalten 
versehen^ wobei der Trainingsmodus in den Vorgang einer 
Spracherkennung integriert ist. Wird das Sprachmuster als in 
der Datenbank bereits vorhanden erkannt und der zugehorige 

15 Befehl aufgefunden, wird in einem vierten Schritt der Befehl 
ausgeftihrt^ wonach der Betriebs vorgang des 

Spracherkennungssystems beendet ist, Dabei erfolgt der Ablauf 
von dem Schritt 1 bis zu dem Schritt 4 im vorliegenden 
Ausfahrungsbeispiel automatisch. 

20 

Wird in dem dritten Schritt 3 das erzeugte Sprachmuster nicht 
erkannt^ erh^lt der Benutzer tiber die Benutzeroberf lache des 
Computersystems die Option^ dem nicht erkannten Sprachmuster 
bzw, der nicht erkannten SprachSufierung einen neuen Befehl 

25 zuzuordnen. Dies geschieht in einem funften Schritt 5 des 

Verfahrens. An dieser Stelle wird das Spracherkennungssystem 
in einen Trainingsmodus umgeschaltet, sofern die Zuordnung 
eines neuen Befehls gewtinscht ist oder automatisch 
herbeigefUhrt wird. Alternativ zu dem fanften Schritt 5 kann 

30 der Benutzer mit Hilfe der Benutzeroberf iSche auch eine neue 
SprachauBerungs-Aufnahme auslGsen, so dass zu dem ersten 
Schritt 1 zurUckgekehrt wird, urn die SprachauBerung zu 
wiederholen. 

35 Wird die Zuordnung eines neuen Befehls zu dem nicht erkannten 
Sprachmuster gewahlt, erfolgt in einem sechsten Schritt 6 die 
Aufnahme einer SprachauBerung, die der nicht erkannten 
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SprachauBerung aus dem ersten Schritt entspricht. Im 
Anschluss daran wird in einem siebten Schritt 7 aus der in 
dem sechsten Schritt 6 aufgenoiranenen SprachauBerung ein 
Sprachmuster erzeugt, und zwar in derselben Weise, wie in dem 
oben erlauterten zweiten Schritt 2. 

In einem achten Schritt 8 wird eine Ahnlichkeitsprufung 
zwischen dem neuen Sprachmuster aus dem siebten Schritt 7 und 
d^ Sprachmuster aus dem zweiten Schritt 2 durchgef iihrt . 
Liegt ein gewOnschtes MaB an Obereinstimmung zwischen den 
beiden Sprachmustem nicht vor, beginnt das Verfahren von 
neuem, bis ein zufriedenstellendes Ergebnis ftir die 
Ahnlichkeit der in dem zweiten Schritt 2 und in dem siebten 
Schritt 7 erzeugten Sprachmuster vorhanden ist. Dabei kSnnen 
der dritte Schritt 3 und der ftofte Schritt 5 tibersprungen 
werden . 



In dem achten Schritt 8 kann auch eine Ahnlichkeitsprtifung 
dahingehend vorgenommen werden, ob das Sprachmuster der neu 
aufgenommenen SprachauBerung einen ausreichenden iftbstand 
gegenOber bereits in der Datenbank vorhandenen Sprachmustem 
einhait. Im negativen Fall kann der Benutzer aufgefordert 
werden, eine andere SprachauBerung zur Zuordnung ftir einen 
neuen Befehl zu verwenden. Fur diese neue SprachauBerung 
beginnt das Verfahren von neuem. 



Im Anschluss daran wird in einem neunten Schritt 9 dem im 
zweiten Schritt 2 erzeugten Sprachmuster ein Befehl 
zugeordnet, und zwar durch geeignete Auswahl des Benutzers 
mit Hilfe der Benutzeroberfiache des Spracherkennungssystems . 
Dazu wird das Sprachmuster aus dem Speicher, in dem es in dem 
zweiten Schritt 2 zwischengespeichert wurde, ausgelesen, mit 
dem in Schritt 7 erzeugten Sprachmuster geeignet verkntipft, 
z. B. durch eine Mittelwertbildung einzelner Eigenschaften 
beider Sprachmuster, und zusammen mit dem neuen Befehl in die 
Datenbank geschrieben. 
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In einem letzten Schritt 10 wird der neu zugeordnete Befehl 
ausgeftihrtr wonach der Spracherkennungsvorgang mit 
integriertem Trainingsmodus abgeschlossen ist. 

5 Es ist hervorzuheben^ dass die in dem vierten und letzten 
Schritt erfolgende Ausfuhrung eines Befehls mit Hilfe einer 
Dmsetzeinrichtung zum Umsetzen des Befehls vonstatten geht, 
Bei dem Befehl kann es sich beispielsweise um die Anwahl 
einer Telef onnummer in einem Koramunikationsnetzwerk oder 
10 einen Sprachbefehl handeln, mit dem an ein Netzwerk 
angeschlossene Gerate gesteuert werden. 

Selbstverstandlich kann bei einer vereinfachten 
Ausftihrungsf orm des Verfahrens bei der Zuordnung eines 

15 Befehls nach dem nexmten Schritt 9 auf die Durchfuhrung der 
vorangehenden Schritte 6 bis 8 verzichtet werden. Auf diese 
Weise erfolgt die Zuordnung eines Befehls unmittelbar auf die 
Abfrage aus dem ftinften Schritt 5. Auch ist es moglich, bei 
der DurchfOhruhg des Verfahrens auf die unmittelbare 

20 AusfOhrung des neu trainierten Befehls (zehnter Schritt) zu 
verzichten. 
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Patentanspriiche 

1- Verfahren zur sprecherabhangigen Spracherkennung mit einem 
Spracherkennungssystem, bei dem SprachauBerungen eines 
5 Benutzers trainiert warden und den trainierten 
Sprachaufierungen Befehle zugeordnet warden, 
dadurch gekennzeichnet, dass bei 
Nichterkennung einer SprachauBerung durch das 
Spracherkennungs system dem Benutzer angeboten wird, die 
10 SprachauBerung unmittelbar einem neuen Befehl zuzuordnen, 

2. Verfahren nach Anspruch 1, 

dadurch gekennzeichnet, dass 
bei Nichterkennxong der SprachaxiBerung durch das 
15 Spracherkennungssystem der Benutzer optional entweder die 
SprachauBerung wiederholen oder die SprachauBerung einem 
neuen Befehl zuordnen kann. 

3. Verfahren nach einem der Ansprtiche 1 oder 2, 

20 dadurch gekennzeichnet, dass 

in dem Fall, wenn noch keiner SprachauBerimg ein Befehl 
zugeordnet ist, das Spracherkennungssystem nach seiner 
Aktivierung das Trainieren eines neuen Befehls anbietet. 

25 4. Verfahren nach einem der Ansprtiche 1 bis 3, 

dadurch gekennzeichnet, dass 
bei Nichterkennung einer SprachauBerung fur einen bereits 
trainierten Befehl durch das Spracherkennungssystem der 
Benutzer den Befehl auswahlen und diesem Befehl die 

30 SprachauBerung zuordnen kann. 

5. Verfahren nach einem der Ansprtiche 1 bis 4, 
dadurch gekennzeichnet, dass 
far eine Erkennung einer SprachauBerung ein Sprachmuster 
35 erzeugt wird, dass der SprachauBerung zugeordnet ist. 
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6. Verfahren nach einem der AnsprUche 1 bis 5, 
dadurch gekennzeichnet, dass 
vor einer Zuordnung eines Befehls zu einer Sprachaufier\ing 
gepruft wird, ob die SprachSuBerung zuvor gespeicherten 
SprachSiiBeriangen ahnlich ist. 



7. Spracherkennungssystem ftir ein sprecherabhSngiges Erkennen 
von Sprache mit 

einer Sprachaufnahmeeinrichtxing zur Aufnahme einer 
10 SprachauBerung eines Benutzers des Spracherkennungssystems, 
einer Suchmaschine, die zum Zugriff auf eine Datenbank 
ausgebildet ist, die eine Zuordnung zwischen SprachSuBerungen 
und Befehlen enthait, um einen der SprachauBerung 
zugeordneten Befehl aufzufinden, 
15 einer Umsetzeinrichtung zum Dmsetzen des auf Griind der 
SprachauBerung aufgefundenen Befehls, 
dadurch gekennzeichnet, dass 
das Spracherkennungssystem derart ausgebildet ist, dass bei 
Nichterkennung der SprachauBerung durch das 
20 Spracherkennungssystem dem Benutzer angeboten wird, die 
SprachauBerung unmittelbar einem neuen Befehl zuzuordnen. 

8. Spracherkennungssystem nach Anspruch 7, 
dadurch gekennzeichnet, dass 

25 die Sprachaufnahmeeinrichtung mit einem Speicher verbunden 
ist, in dem die SprachauBerung zwischengespeichert wird und 
der mit der Datenbank zum Einlesen der SprachauBerung in die 
Datenbank verbunden ist. 

30 9. Spracherkennungssystem nach einem der Ansprttche 7 oder 8, 
dadurch gekennzeichnet, dass 
eine Merkmalsextraktionseinrichtung zum. Erzeugen eines 
Sprachmusters aus der SprachauBerung zwischen der 
Sprachaufnahmeeinrichtung und dem Speicher vorgesehen ist und 

35 das Sprachmuster die SprachauBerung ersetzt. 
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